Что происходит, когда в наших данных есть коррелированные фичи?
В случайном лесу, поскольку случайный лес выбирает некоторые объекты для построения каждого дерева, вероятность выбора информации, содержащейся в коррелированных объектах, в два раза выше, чем любая другая информация, содержащаяся в других объектах.
В общем, когда вы добавляете коррелированные функции, это означает, что они линейно содержат одну и ту же информацию, и, следовательно, это снижает надежность вашей модели. Каждый раз, когда вы тренируете свою модель, она может выбирать ту или иную функцию, чтобы «выполнить одну и ту же работу», т. е. объяснить некоторую дисперсию, уменьшить энтропию и т. д.
Что происходит, когда в наших данных есть коррелированные фичи?
В случайном лесу, поскольку случайный лес выбирает некоторые объекты для построения каждого дерева, вероятность выбора информации, содержащейся в коррелированных объектах, в два раза выше, чем любая другая информация, содержащаяся в других объектах.
В общем, когда вы добавляете коррелированные функции, это означает, что они линейно содержат одну и ту же информацию, и, следовательно, это снижает надежность вашей модели. Каждый раз, когда вы тренируете свою модель, она может выбирать ту или иную функцию, чтобы «выполнить одну и ту же работу», т. е. объяснить некоторую дисперсию, уменьшить энтропию и т. д.
BY Библиотека собеса по Data Science | вопросы с собеседований
Warning: Undefined variable $i in /var/www/tg-me/post.php on line 283
The Singapore stock market has alternated between positive and negative finishes through the last five trading days since the end of the two-day winning streak in which it had added more than a dozen points or 0.4 percent. The Straits Times Index now sits just above the 3,060-point plateau and it's likely to see a narrow trading range on Monday.
Newly uncovered hack campaign in Telegram
The campaign, which security firm Check Point has named Rampant Kitten, comprises two main components, one for Windows and the other for Android. Rampant Kitten’s objective is to steal Telegram messages, passwords, and two-factor authentication codes sent by SMS and then also take screenshots and record sounds within earshot of an infected phone, the researchers said in a post published on Friday.
Библиотека собеса по Data Science | вопросы с собеседований from in